Penerapan teknik web scraping pada mesin pencari artikel ilmiah

نویسندگان

  • Ahmad Josi
  • Leon Andretti Abdillah
  • Suryayusra
چکیده

Search engines are a combination of hardware and computer software supplied by a particular company through the website which has been determined. Search engines collect information from the web through bots or web crawlers that crawls the web periodically. The process of retrieval of information from existing websites is called "web scraping." Web scraping is a technique of extracting information from websites. Web scraping is closely related to Web indexing, as for how to develop a web scraping technique that is by first studying the program makers HTML document from the website will be taken to the information in the HTML tag flanking the aim is for information collected after the program makers learn navigation techniques on the website information will be taken to a web application mimicked the scraping that we will create. It should also be noted that the implementation of this writing only scraping involves a free search engine such as: portal garuda, Indonesian scientific journal databases (ISJD), google scholar.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

The Development of Semantic Web to Search Student Final Study Collections (Work Practice and Final Project)

1. H. F. Gunawan, “Penerapan Web Semantik Untuk Aplikasi Pencarian Pada Repositori Koleksi Penelitian ,Studi Kasus : Program Studi Sistem Informasi Stmik Mikroskil Medan,” vol. 15, no. 1, pp. 51–60, 2014. 2. I. A. S. Wicaksono, N. Charibaldi, and H. Jayadianti, “Penerapan Teknologi Semantic Web untuk Menentukan Pilihan Jalur Bis Trans Jogja,” Semin. Nas. Inform. 2010 (semnasIF 2010), vol. 2010,...

متن کامل

Watermarking pada Video: Robustness, Impercetibility dan Pendekatan untuk Domain Terkompresi

ABSTRAK Meningkatnya penggunaan dokumen digital khususnya multimedia (citra, audio, video) dan kemudahan transmisi data melalui Internet meningkatkan kebutuhan terhadap keamanan data terhadap pelanggaran hak cipta. Watermarking merupakan pendekatan yang telah banyak digunakan dan merupakan bagian dari Digital Right Management (DRM) yang dibuat untuk memenuhi kebutuhan tersebut. Khusus untuk vid...

متن کامل

Analisis Kinerja Sistem Cluster Terhadapa Aplikasi Simulasi Dinamika Molekular NAMD Memanfaatkan Pustaka CHARM++

Tingkat kompleksitas dari program simulasi dinamika molekular membutuhkan mesin pemroses dengan kemampuan yang sangat besar. Mesin-mesin paralel terbukti memiliki potensi untuk menjawab tantangan komputasi ini. Untuk memanfaatkan potensi ini secara maksimal, diperlukan suatu program paralel dengan tingkat efisiensi, efektifitas, skalabilitas, dan ekstensibilitas yang maksimal pula. Program NAMD...

متن کامل

Modification of Itu-r Rain Fade Slope Prediction Model Based on Satellite Data Measured at High Elevation Angle

Rain fade slope is one of fade dynamics behaviour used by system engineers to design fade mitigation techniques (FMT) for space-earth microwave links. Recent measurements found that fade slope prediction model proposed by ITU-R is unable to predict fade slope distribution accurately in tropical regions. Rain fade measurement was conducted in Kuala Lumpur (3.3 N, 101.7 E) where located in heavy ...

متن کامل

Project Evaluation Method Based on Matter-Element and Hierarchy Model

Abstrak Evaluasi proyek selalu menjadi kunci dari manajemen proyek rekayasa. Evaluasi proyek adalah pekerjaan yang kompleks yang melibatkan banyak faktor. Hasil evaluasi akhir selalu dipengaruhi langsung oleh definisi indeks evaluasi yang bervariasi dan bobot yang terkait. Makalah ini terutama mempelajari penilaian kemampuan para ahli dan pembentukan sistem evaluasi proyek indeks dalam tinjauan...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1410.5777  شماره 

صفحات  -

تاریخ انتشار 2014